|
|
| Acesso ao texto completo restrito à biblioteca da Embrapa Agricultura Digital. Para informações adicionais entre em contato com cnptia.biblioteca@embrapa.br. |
Registro Completo |
Biblioteca(s): |
Embrapa Agricultura Digital. |
Data corrente: |
15/03/2010 |
Data da última atualização: |
15/01/2020 |
Tipo da produção científica: |
Artigo em Anais de Congresso / Nota Técnica |
Autoria: |
CONRADO, M. da S.; MARCACINI, R. M.; MOURA, M. F.; REZENDE, S. O. |
Afiliação: |
MERLEY DA SILVA CONRADO, ICMC/USP; RICARDO MARCONDES MARCACINI, ICMC/USP; MARIA FERNANDA MOURA, CNPTIA, ICMC/USP; SOLANGE OLIVEIRA REZENDE, ICMC/USP. |
Título: |
O efeito do uso de diferentes formas de geração de termos na compreensibilidade e representatividade dos termos em coleções textuais na língua portuguesa. |
Ano de publicação: |
2009 |
Fonte/Imprenta: |
In: BRAZILIAN SYMPOSIUM IN INFORMATION AND HUMAN LANGUAGE TECHNOLOGY, 7; INTERNATIONAL WORKSHOP ON WEB AND TEXT INTELLIGENCE, 2., 2009; 7., 2009, São Carlos, SP: Proceedings... São Carlos: ICMC, USP, 2009. |
Páginas: |
p. 1-10. |
Idioma: |
Português |
Notas: |
WTI 2009. STIL 2009. |
Conteúdo: |
A geração de termos em coleções textuais pode ser empregada para diversos ?ns nos processos de extração de conhecimento. Tendo em vista sua importância, neste trabalho, avaliou-se os efeitos produzidos na compreensibilidade e representatividade dos atributos quando utilizadas diferentes formas de geração de termos a partir de coleções textuais. Estas diferentes formas de geração de termos utilizam principalmente três técnicas de simpli?cação de termos: radicalização, lematização e substantivação. Para apoiar a avaliação da compreensibilidade dos termos foram utilizadas taxonomias de tópicos, possibilitando a avaliação subjetiva dos especialistas do domínio, tendo a técnica de substantivação, seguida da lematização, como a que obtém termos mais compreensíveis. Já para apoiar a avaliação objetiva da representatividade dos termos em relação as coleções textuais, utilizou-se a medida CTW, sendo que a técnica de radicalização mostrou-se mais e?caz na recuperação de termos em um vocabulário expandido, considerando para ambos o mesmo domínio. |
Palavras-Chave: |
Compreensibilidade de atributos; Geração de termos; Lematização; Radicalização; Recuperação de termos; Representatividade de atributos; Substantivação; Técnicas de simplificação de termos. |
Categoria do assunto: |
X Pesquisa, Tecnologia e Engenharia |
Marc: |
LEADER 02173nam a2200265 a 4500 001 1661159 005 2020-01-15 008 2009 bl uuuu u00u1 u #d 100 1 $aCONRADO, M. da S. 245 $aO efeito do uso de diferentes formas de geração de termos na compreensibilidade e representatividade dos termos em coleções textuais na língua portuguesa.$h[electronic resource] 260 $aIn: BRAZILIAN SYMPOSIUM IN INFORMATION AND HUMAN LANGUAGE TECHNOLOGY, 7; INTERNATIONAL WORKSHOP ON WEB AND TEXT INTELLIGENCE, 2., 2009; 7., 2009, São Carlos, SP: Proceedings... São Carlos: ICMC, USP$c2009 300 $ap. 1-10. 500 $aWTI 2009. STIL 2009. 520 $aA geração de termos em coleções textuais pode ser empregada para diversos ?ns nos processos de extração de conhecimento. Tendo em vista sua importância, neste trabalho, avaliou-se os efeitos produzidos na compreensibilidade e representatividade dos atributos quando utilizadas diferentes formas de geração de termos a partir de coleções textuais. Estas diferentes formas de geração de termos utilizam principalmente três técnicas de simpli?cação de termos: radicalização, lematização e substantivação. Para apoiar a avaliação da compreensibilidade dos termos foram utilizadas taxonomias de tópicos, possibilitando a avaliação subjetiva dos especialistas do domínio, tendo a técnica de substantivação, seguida da lematização, como a que obtém termos mais compreensíveis. Já para apoiar a avaliação objetiva da representatividade dos termos em relação as coleções textuais, utilizou-se a medida CTW, sendo que a técnica de radicalização mostrou-se mais e?caz na recuperação de termos em um vocabulário expandido, considerando para ambos o mesmo domínio. 653 $aCompreensibilidade de atributos 653 $aGeração de termos 653 $aLematização 653 $aRadicalização 653 $aRecuperação de termos 653 $aRepresentatividade de atributos 653 $aSubstantivação 653 $aTécnicas de simplificação de termos 700 1 $aMARCACINI, R. M. 700 1 $aMOURA, M. F. 700 1 $aREZENDE, S. O.
Download
Esconder MarcMostrar Marc Completo |
Registro original: |
Embrapa Agricultura Digital (CNPTIA) |
|
Biblioteca |
ID |
Origem |
Tipo/Formato |
Classificação |
Cutter |
Registro |
Volume |
Status |
URL |
Voltar
|
|
Registros recuperados : 40 | |
10. | | MOURA, M. F.; MACACINI, R. M.; REZENDE, S. O. Easily labelling hierarchical document clusters. In: SIMPÓSIO BRASILEIRO DE BANCO DE DADOS, 23.; SIMPÓSIO BRASILEIRO DE ENGENHARIA DE SOFTWARE, 22.; WORKSHOP EM ALGORITMOS E APLICAÇÕES DE MINERAÇÃO DE DADOS, 4., 2008, Campinas. Anais... Campinas: UNICAMP, Instituto de Computação, 2008. p. 37-45.Tipo: Artigo em Anais de Congresso / Nota Técnica |
Biblioteca(s): Embrapa Agricultura Digital. |
| |
14. | | RODRIGUES, L. S.; SINOARA, R. A.; REZENDE, S. O.; MARCACINI, R. M.; MOURA, M. F. Identificação de Pontos Perceptualmente Importantes (PIP) em séries temporais de tópicos extraídos de dados textuais. In: MOSTRA DE ESTAGIÁRIOS E BOLSISTAS DA EMBRAPA INFORMÁTICA AGROPECUÁRIA, 11., 2015, Campinas. Resumos expandidos... Brasília, DF: Embrapa, 2015. p. 38-44.Tipo: Artigo em Anais de Congresso |
Biblioteca(s): Embrapa Agricultura Digital. |
| |
17. | | SILVA JÚNIOR, E. L.; SINOARA, R. A.; REZENDE, S. O.; MARCACINI, R. M.; MOURA, M. F. Uma ferramenta para expansão do vocabulário com base em coocorrência. In: MOSTRA DE ESTAGIÁRIOS E BOLSISTAS DA EMBRAPA INFORMÁTICA AGROPECUÁRIA, 11., 2015, Campinas. Resumos expandidos... Brasília, DF: Embrapa, 2015. p. 11-16.Tipo: Artigo em Anais de Congresso |
Biblioteca(s): Embrapa Agricultura Digital. |
| |
18. | | VARGAS, R. N. P.; MOURA, M. F.; SPERANZA, E. A.; RODRIGUEZ, E.; REZENDE, S. O. The SpatialCIM methodology for spatial document coverage disambiguation and the entity recognition process aided by linguistic techniques. In: GEOSPATIAL INFORMATION AND DOCUMENTS; PACIFIC-ASIA CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING, 16., 2012, Kuala Lumpur. Workshop... [S.l.: s.n.], 2012. Não paginado. GeoDoc 2012, PAKDD 2012.Tipo: Artigo em Anais de Congresso |
Biblioteca(s): Embrapa Agricultura Digital. |
| |
19. | | MOURA, M. F.; MARCACINI, R. M.; NOGUEIRA, B. M.; CONRADO, M. da S.; REZENDE, S. O. A proposal for building domain topic taxonomies. In: WORKSHOP ON WEB AND TEXT INTELLIGENCE, 1.; SIMPÓSIO BRASILEIRO EM INTELIGÊNCIA ARTIFICIAL, 19., 2008, Salvador: Proceedings... São Carlos: ICMC/USP, 2008. p. 83-84.Tipo: Resumo em Anais de Congresso |
Biblioteca(s): Embrapa Agricultura Digital. |
| |
Registros recuperados : 40 | |
|
Nenhum registro encontrado para a expressão de busca informada. |
|
|